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Beschreibung 

[0001] Die Erfindung betriffl eine Vonichtung zur 
sprecherunabhSngigen Sprachnamenwahl fur Tele- 
kommunikations-Endeinrichtungen, bestehend aus ei- 
nem Speicher fur Rufnummem und Namen, in welchem 
Namen sowie jeweils die damit assoziierte Rufnummer 
als ASCII-Text hinterlegt sind, einem Graphem-Pho- 
nem-Umsetzer zur Erstellung eines digitalen Wortmo- 
dells (Phonemkette) aus einem ASCII-Text (Graphem- 
kette), einem phonembasierten Spracherkenner zum 
Vergleichen eines gesprochenen, digitalisierten 
Sprachsignals mit vorbestimmten digitalen Wortmodel- 
len, deren ASCII-Entsprechung bekannt ist und Bestim- 
men desjenigen Wortmodells, welches die groftte Ober- 
einstimmung mit dem Sprachsignal aufweist, wobei der 
Speicher durch alphanumerische Eingabe von benut- 
zerdefinierten Namen und assoziierten Rufnummem 
belegbar ist und der Graphem-Phonem-Umsetzer aus 
dem eingegebenen Namen ein entsprechendes digita- 
ls Wortmodell erstellt, welches zusammen mit dem 
ASCII-Text oder einem diesem zugeordneten Kode der- 
ail gespeichert wird, daft der Spracherkenner daraufzu- 
greifen kann, wobei zur automatischen Sprachnamen- 
wahl ein akustisch eingegebener Name als digitales 
Sprachsignal dem Spracherkenner ubermittelt und von 
diesem mit vorbestimmten Wortmodellen verglichen 
wird, und der Spracherkenner dem Wortmodell, das mit 
dem Sprachsignal die groftte Obereinstimmung auf- 
weist, entsprechende ASCII-Text oder den diesem zu- 
geordneten Kode ermittelt, welcher zum Abruf der as- 
soziierten Rufnummer aus dem Speicher dient, wobei 
durch die Sprech- und Wahleinrichtung der Endeinrich- 
tung automatisch eine Telekommunikationsverbindung 
mit dieser Rufnummer aufgebaut wird, gemaft dem 
Oberbegriff des Anspruchs 1 sowie ein Verfahren zur 
Einrichtung eines individuellen Rufnummernverzeich- 
nisses zur sprecherunabhangigen Sprachnamenwahl 
fur Telekom-Endeinrichtungen gemaft dem Oberbegriff 
des Anspruchs 4. 

[0002] Es sind Telefone mit Sprachnamenwahl be- 
kannt, bei welchen durch akustische Eingabe des Na- 
mens eines Netzteilnehmers automatisch eine Kommu- 
nikationsverbindung mit der diesem Namen zugeordne- 
ten Rufnummer eingeleitet wird, indem diese Rufnum- 
mer automatisch angewShlt wird. Bekannte Telefone mit 
Sprachnamenwahl benutzen die dem Stand derTechnik 
entsprechende sprecherabhangige Namenwahl unter 
Verwendung sprecherabhangiger Spracherkenner. Die 
Verwendung sprecherabhangiger Spracherkenner 
setzt voraus, daft die Namen, die per Namenwahl akti- 
viert werden sollen, in einer vorgeschalteten Trainings- 
prozedur durch m eh rf aches Vorsprechen angelernt 
worden sind. 

[0003] ZweckmSftigerweise werden bei der Durch- 
fuhrung dieser Train ingsprozedur die zu den Namen as- 
soziierten Rufnummer mit eingegeben und in einem in- 
dividuellen Namens- und Rufnummernverzeichnis ab- 



gelegt. Die Namen werden in der Einlernphase durch 
den Nutzer akustisch eingegeben und als digitalisiertes 
Sprachsignal gespeichert, wobei im der Anwendungs- 
fall gesprochene Name mit diesen hintertegten Na- 

5 mensmustern verglichen wird und bei Obereinstimmung 
die dem erkannten Namensmuster zugeordnete Ruf- 
nummer angewahlt wird. Fur nicht mit den Erfordernis- 
sen der sprecherabhangigen Spracherkennung ver- 
trauten Nutzem stellt die Trainingsphase allerdings eine 

10 hohe interlektuelle Anforderung dar. Daher werden Te- 
lefone, die mit diesem Komfortmerkmal ausgestattet 
sind, oftmals falsch bedient. 

[0004] Die Verwendung eines sprecherabhangigen 
Spracherkenners fuhrt auch bei korrekt durchgefuhrter 
15 Einlernphase dazu, daft die Namensmuster meist nur 
dann gut wiedererkannt werden, wenn die Person, die 
das Training durchgefuhrt hat, auch der spatere Nutzer 
des Telefons ist. Dadurch kann nur die trainierende Per- 
son das so angelegte Namensverzeichnis und damit die 
20 automatische Sprachnamenwahl optimal nutzen. Ande- 
re Personen mit anderem individuellem Sprachverhal- 
ten werden deutlich schlechter erkannt. 
[0005] Durch die WO 96/35207 ist eine Vonichtung 
zur sprecherunabhangigen Sprachnamenwahl fur Tele- 
25 kommunikations-Endeinrichtungen der eingangs ge- 
nannten Gattung bekannt geworden. Diese weist einen 
Speicher fur Rufnummem und Namen auf, in dem Na- 
men sowie jeweils die damit assoziierte Rufnummer als 
ASCII-Text hinterlegt sind, einen Graphem-Phonem- 
30 Umsetzer sowie einen phonembasierten Spracherken- 
ner zum Vergleichen eines gesprochenen, digitalisier- 
ten Sprachsignals mit vorbestimmten digitalen Wortmo- 
dellen. Der Graphem-Phonem-Umsetzer erstellt aus 
dem Namen ein entsprechendes digitales Wortmodell, 
35 welches als digitales Sprachsignal dem Spracherken- 
ner ubermittelt und von diesem mit vorbestimmten Wort- 
modellen verglichen wird. Bei Obereinstimmung wird 
durch die Sprech- und Wahleinrichtung der Endeinrich- 
tung automatisch eine Telekommunikationsverbindung 
40 mit dieser Rufnummer aufgebaut. 

[0006] Der Erfindung liegt die Aufgabe zugrunde, die 
Sprachnamenwahl bei Telekommunikations-Endein- 
richtungen derart zu verbessern, daft ein einf aches An- 
legen des individuellen Namens- und Rufnummernver- 
45 zeichnisses sowie im Anwendungsfall eine weitgehend 
sprecherunabhangige Erkennung automatisch anzu- 
wahlender Namen moglich ist. 

[0007] Die Aufgabe wird bei einer Vonichtung der ein- 
gangs genannten Gattung dadurch gelost, dass die 
so Graphem-Phonem-Umsetzung durch ein Ausnahme- 
Lexikon untersttitzt wird, in welchem phonetischen Ei- 
genarten von Eigennamen entsprechende Sequenzen 
hinterlegt sind, welche durch den Graphem-Phonem- 
Umsetzer (8) in die Phonemkette eingefugt werden. 
55 [0008] VerfahrensmSftig ist die Losung der Aufgabe, 
ein Verfahren des Oberbegriffs des Anspruchs 4 weiter- 
zuentwickeln, dadurch gekennzeichnet, dass das ei- 
nem Namen zugeordnete Wortmodell (Phonemkette) 
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aus einer Datenbank, in wetcher Eigennamen entspre- 
chenden Phoneme bzw- Phonemketten hinteriegt sind, 
ermittelt wird. 

[0009] Dank des Einsatzes phonembasierter spre- 
cherunabhSngiger Spracherkenner kann ein wie auch 
immer geartetes Training ganz entfallen. Das Einrichten 
des Namens- und Rufnummernverzeichnisses wird re- 
duziert auf die bekannte Eingabe der Rufnummer und 
des Namens in orthografischer Weise Ober die Tastatur 
des Endgerates. Die eingegebenen Informationen bzw. 
Buchstaben werden mittels des Graphem-Phonem- 
Umsetzers in sprachlich abrufbare und horbare Einhei- 
ten bzw. Lautzeichen (Phoneme) umgewandelt und aus 
einer Graphemkette Oder -folge, also einem aus Buch- 
staben gebildeten Wort, eine Phonemkette oder -folge 
aus einer Mehrzahl von Lautzeichen gebildet. Damit 
werden den eingegebenen Namen entsprechende 
standardisierte Wortmodelle gebildet, welche durch die 
Zusammensetzung aus Standard-Lauten (Phonemen) 
aus einer Datenbasis unabhangig von der Person ist, 
welche das Rufnummernverzeichnis einrichtet Damit 
konnen im Anwendungsfall Spracheingaben dieser Per- 
son wie auch jedes weiteren Nutzer mit etwa gleicher 
Wahrscheinlichkeit erkannt werden. 
[001 0] Da es haufig verschiedene Moglichkeiten gibt, 
einen geschriebenen Text in Laute umzusetzen, wird 
das vom Graphem-Phonem-Umsetzer aufgrund der 
Texteingabe erstellte Wortmodell vor der entgultigen 
Speicherung dem Benutzer als synthetisches Sprachsi- 
gnal uber einen Lautsprecher vorgespielt. Der Benutzer 
kann dann priifen, ob das berechnete Wortmodell die 
korrekte Wiedergabe des Namens ist und gegebenen- 
falls eine alternative Lautumsetzung veranlassen. 
[001 1 ] Erfindung sgemafi wird die Graphem-Phonem- 
Umsetzung durch ein Ausnahme-Lexikon unterstutzt, in 
welchem phonetischen Eigenarten von Eigennamen 
entsprechende Sequenzen hinteriegt sind, welche 
durch den Graphem-Phonem-Umsetzer in die Phonem- 
kette eingefiigt werden. Damit konnen auch die bei Ei- 
gennamen haufig auftretenden Abweichungen von der 
Oblichen Schrift-Laut-Umsetzung bei der Berechnung 
der Phonemkette berucksichtigt werden, wodurch die 
spatere Erkennung des Eigennamens erleichtert wird. 
Weiterhin wird die Graphem-Phonem-Umsetzung vor- 
teilhaft durch eine Onomastika-Datenbank unterstutzt, 
in welcher Eigennamen als ASCII-Text sowie als digita- 
ls Wortmodell gespeichert sind. Bei Eingabe des Na- 
mens als Text wird zunachst gepriift, ob dieser Name in 
der Datenbank vorhanden ist und gegebenenfalls ihm 
die dort hinterlegte Phonemkette zugewiesen. Andern- 
falls wird die buchstabengemafte Umwandlung in eine 
Phonemkette vorgenommen, eventuell unter Zuhilfe- 
nahme des Ausnahme-Lexikons. 
[001 2] Innerhalb der Vorrichtung wird der eingegebe- 
ne Name, das diesem entsprechende durch die Vorrich- 
tung bestimmte Wortmodell sowie die zum Namen ein- 
gegebene Rufnummer derart abgelegt, dali stets eine 
Zuordnung dieser Daten zueinander getroffen werden 



kann, z.B. indem ein Datensatz mit einer Kodeziffer ver- 
sehen wird. In diesem Fall kann die Hinteriegung des 
Namensmusters bzw. Wortmodells auch getrennt von 
Name und Rufnummer erfolgen, z.B. innerhalb des 

5 Spracherkenners. 

[001 3] Das vom Benutzer der Vorrichtung eingegebe- 
ne Sprachsignal ist derjenige Name eines Telefonnetz- 
teilnehmers, dessen in der Einlemphase eingegebene 
Rufnummer durch die Vorrichtung automatisch ange- 

10 wahlt werden soil. Das Sprachsignal wird digitalisiert 
und dem Spracherkenner ubermittelt der einen Ver- 
gleich mit vorbestimmten digitalen Wortmodellen, die in 
der Einlemphase mittels des Graphem-Phonem-Um- 
setzers erstellt wurden, durchfuhrt. Dasjenige Wortmo- 

15 dell , das die groBte Obereinstimmung mit dem eingege- 
benen Sprachsignal aufweist, ist das Erkennungser- 
gebnis des Spracherkenners. Weisen samtliche hinter- 
legten Namensmuster zu gro&e Abweichungen vom 
eingegebenen Sprachsignal auf und ist somit eine Iden- 

20 tifizierung des Namens nicht moglich, so gibt die Vor- 
richtung eine Fehlermeldung aus und fordert vorzugs- 
weise zur emeuten akustischen Eingabe des Namens 
auf. 

[0014] Dadurch daB die Erstellung der Phonemkette 

25 bzw. des Wortmodells auf standardisierten Lauten ba- 
siert, wird eine vom individuellen Sprachverhalten un- 
abhangige Referenz geschaffen, wobei das im Anwen- 
dungsfall von einem Benutzer gesprochene Wort durch 
Vergleich mit den vorhandenen Referenzobjekten, den 

30 vorbestimmten Wortmodellen, ermittelt wird. Somit ge- 
lingt im Gegensatz zur sprecherabhangigen Spracher- 
kennung, bei der die durch individuelles Training ge- 
schaffenen Wortmodelle lediglich eine subjektive Refe- 
renz darstellen, eine weitgehend sprecherunabhangige 

35 Zuordnung des gesprochenen Worts zu dem vorbe- 
stimmten Wortmodell und zur damit assoziierten Ruf- 
nummer. Die Erkennungssicherheit ist fur alle Nutzer 
der erfindungsgemaBen Vorrichtung etwa gleich. 
[0015] Wurde ein Name erkannt, indem eine weitge- 

40 hende Obereinstimmung zwischen dem eingegebenen 
Sprachsignal und dem hinterlegten Wortmodell festge- 
stellt wurde, wird vorzugsweise der dem Wortmodell 
entsprechende Name als Text auf einem Display darge- 
stellt oder das Wortmodell als synthetische Sprache 

45 Qber einen Lautsprecher wiedergegeben. Nach Besta- 
tigung des Erkennungsergebnisses durch den Nutzer 
wird die automatische Wahl mit der Wortmodell und Na- 
men zugeordneten Rufnummer durchgefuhrt. 
[001 6] Die Erfindung wird nachfolgend an einem Aus- 

50 fuhrungsbeispiel erlSutert. Figur 1 zeigt ein Blockdia- 
gramm einer erfindungsgemSlien Vorrichtung zur spre- 
cherunabhSngigen Sprachnamenwahl. Der Daten- 
transfer und dessen Richtung zwischen den einzelnen 
dargestellten Komponenten ist durch Pfeile angedeutet. 

55 [0017] Die Vorrichtung weist die bekannten Kompo- 
nenten einer Telekommunikations-Endeinrichtung auf, 
das sind der Telefonnetzzugang 1, die Sprech- und 
WShleinrichtung 2 und ein Mikrofon 3 sowie einen Laut- 
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sprecher4 zur Spracheingabe bzw. Sprachwiedergabe 
uber einen Telefonhorer oder innerhalb einer Frei- 
sprecheinrichtung. Das Telefon weist weiterhin eine Ta- 
statur 5 zur Eingabe von Wahlbefehlen sowie ein Dis- 
play zur Anzeige von Informationen auf. 
[0018] Das Telefon mit sprecherunabhangiger 
Sprachnamenwahl weist einen Speicher 6 fur Rufnum- 
mem und Namen im ASCII-Format, einen Graphem- 
Phonem-Umsetzer 8 sowie einen phonembasierten 
HMM-Spracherkenner auf. 

[001 9] Die Vorrichtung wird in zwei Phasen angewen- 
det. In der ersten Phase, der Einlemphase, erfolgt die 
Eingabe der Rufnummer und des assoziierten Namens 
uber die alpha-numerische Tastatur 5 in den Speicher 
6 des EndgerStes. Nach jeder Eingabe eines neu hin- 
zugekommenen Namens wird aus dem im Speicher 6 
abgelegen Namen durch den Graphem-Phonem-Um- 
setzer 8 ein neues Wortmodell fur den HMM-Spracher- 
kenner 7 berechnet. Zur Unterstutzung der Umsetzung 
von Eigennamen in eine Phonemkette wird ein Ausnah- 
me-Lexikon zur Graphem-Phonem-Umsetzung zuhilfe 
genommen. Bei der Vorrichtung wird hierfur eine Ono- 
mastika-Datenbank 9 verwendet, die die meisten vor- 
kommenden Eigennamen einer Sprache beinhaltet. Mit 
der Berechnung der Wortmodelle zu alien eingegebe- 
nen Namen durch den Graphem-Phonem-Umsetzer 8 
und gegebenenfalfs deren Bestatigung durch den Be- 
nutzer nach Wiedergabe als synthetische Sprache mit- 
tels einer Text-to-Speech-Einheit 11 uber die Sprechund 
Wahleinrichtung 2 sowie den Lautsprecher 4 ist die e 
Einlemphase abgeschlossen. Das damit angelegte Ruf- 
nummernverzeichnis kann jedoch jederzeit durch er- 
neute Eingabe von Name und Rufnummer erweitert 
werden. 

[0020] In der zweiten Phase wird die Sprachnamen- 
wahl benutzt, um eine Verbindung zu einem gewunsch- 
ten Teilnehmer aufzubauen. Zu diesem Zweck spricht 
der Nutzer den Namen des gewunschten Teitnehmers 
entweder uber das Mikrofon 3 des Handsets oder der 
Freisprecheinrichtung in die Endeinrichtung. Das 
Sprachsignal wird Uber die Sprech- und Wahleinrich- 
tung 2 an den HMM-Spracherkenner 7 weitergeleitet. 
Der Spracherkenner 7 erkennt durch Vergleich mit den 
vorbestimmten Wortmodellen den wahrscheinlichesten 
Namen des Wortmodells und liefert das Erkennungser- 
gebnis an den Speicher fur Rufnummem und Namen 6. 
Dber die Zuordnung des Namens zur Rufnummer kann 
nunmehr uber die Sprech- und Wahleinrichtung 2 der 
Verbindungsaufbau uber den Netzzugang 1 vorgenom- 
men werden. Es ist vorgesehen, dati der erkannte Na- 
me zur Bestatigung in seiner ASCI l-Darstellung auf dem 
Display 10 dargestellt oder als synthetisches Sprachsi- 
gnal akustisch uber den Lautsprecher des Handsets 
oder der Freisprecheinrichtung 4 wiedergegeben wird. 
Dazu wird der erkannte Name in seiner ASCI l-Darstel- 
lung einem Text-to-Speech-Synthetisator 11 zur Erzeu- 
gung eines synthetischen Sprachsignals zugeftihrt oder 
die synthetische Sprache durch akustische Wiedergabe 



des erkannten Wortmodells erzeugt. 
[0021] Da der Graphem-Phonem-Umsetzer 8 und der 
Text-to-Speech-Synthetisator 11 gleichermafien auf ei- 
ne Datenbasis zur Graphem-Phonem-Umsetzung zu- 
5 greifen, kann diese Ressource gemeinsam genutzt wer- 
den. 

Liste der Bezugszeichen: 



10 


[0022] 




1 


Telefonnetzzugang 




2 


Sprech- und Wahleinrichtung 




3 


Mikrofon 


15 


4 


Lautsprecher 




5 


alphanumerische Tastatur 




6 


Speicher fur Rufnummem und Namen 




7 


phonembasierter Spracherkenner 




8 


Graphem-Phonem-Umsetzer 


20 


9 


Onomastika-Datenbank 




10 


Display 




11 


Text-to-Speech-Synthetisator 



25 Patentanspruche 

1. Vorrichtung zur sprecherunabhangigen Sprachna- 
menwahl fur Telekommunikations-Endeinrichtun- 
gen, bestehend aus einem Speicher (6) fur Rufnum- 

30 mem und Namen, in welchem Namen sowie jeweils 
die damit assoziierte Rufnummer als ASCII-Text 
hintertegtsind, einem Graphem-Phonem-Umsetzer 
(8) zur Erstellung eines digitalen Wortmodells (Pho- 
nemkette) aus einem ASCII-Text (Graphemkette), 

35 einem phonembasierten Spracherkenner (7) zum 
Vergleichen eines gesprochenen, digitalisierten 
Sprachsignals mit vorbestimmten digitalen Wort- 
modellen, deren ASCII-Entsprechung bekannt ist 
und Bestimmen desjenigen Wortmodells, welches 

*o die grolite Obereinstimmung mit dem Sprachsignal 
aufweist, wobei der Speicher (6) durch alphanume- 
rische Eingabe von benutzerdefinierten Namen und 
assoziierten Rufnummem belegbar ist und der Gra- 
phem-Phonem-Umsetzer (8) aus dem eingegebe- 

45 nen Namen ein entsprechendes digitales Wortmo- 
dell erstellt, welches zusammen mit dem 
ASCII-Text oder einem diesem zugeordneten Kode 
derail gespeichert wird, daft der Spracherkenner 
(7) darauf zugreifen kann, wobei zur automatischen 

so Sprachnamenwahl ein akustisch eingegebener Na- 
me als digitales Sprachsignal dem Spracherkenner 
(7) ubermittelt und von diesem mit vorbestimmten 
Wortmodellen verglichen wird, und der Spracher- 
kenner (7) dem Wortmodell, das mit dem Sprachsi- 

55 gnal die grdftte Obereinstimmung aufweist, den 
entsprechenden ASCII-Text oder den diesem zuge- 
ordneten Kode ermittelt, welcher zum Abruf der as- 
soziierten Rufnummer aus dem Speicher (6) dient, 
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wobei durch die Sprechund Wahleinrichtung (2) der 
Endeinrichtung automatisch eine Telekommunika- 
tionsverbindung mit dieser Rufnummer aufgebaut 
wird, 

dadurch gekennzeichnet, 
dass die Graphem-Phonem-Umsetzung durch ein 
Ausnahme-Lexikon unterstutzt wird, in welchem 
phonetischen Eigenarten von Eigennamen ent- 
sprechende Sequenzen hinterlegt sind, welche 
durch den Graphem-Phonem-Umsetzer (8) in die 
Phonemkette eingefugt werden. 

2. Vorrichtung nach Anspruch 1, dadurch gekenn- 
zeichnet, 

dad die Graphem-Phonem-Umsetzung durch eine 
Onomastika-Datenbank unterstutzt wird, in welcher 
Eigennamen als ASCII-Text sowie als digitales 
Wortmodell gespeichert sind. 

3. Vorrichtung nach Anspruch 1 oder 2, dadurch ge- 
kennzeichnet, 

daft das digitale Wortmodell, bei dem der Sprach- 
erkenner (7) die grdlite Obereinstimmung mit einem 
als Sprachsignal eingegebenen Namen feststellt, 
mittels eines Sprachsynthetisators (11) akustisch 
wiedergegeben wird, bevor der automatische Ver- 
bindungsaufbau eingeleitet wird und erst nach Be- 
statigung des Erkennungsergebnisses der automa- 
tische Verbindungsaufbau mit der dem erkannten 
Namen entsprechenden Rufnummer ausgefuhrt 
wird. 

4. Verfahren zur Einrichtung eines individuellen Ruf- 
nummemverzeichnisses zur sprecherunabhangi- 
gen Sprachnamenwahl furTelekom-Endeinrichtun- 
gen, mit alphanumerischer Eingabe eines oder 
mehrerer Namen und assoziierter Rufnummern, 
Speicherung der eingegebenen Daten im 
ASCII-Format, Berechnung eines digitalen Wort- 
modells des bzw. der Namen auf der Basis des ent- 
sprechenden ASCII-Textes durch Graphem-Pho- 
nem-Umsetzung, Speicherung des Wortmodells 
derart, daB die Zuordnung zum zugrundeliegenden 
ASCII-Text moglich ist, unter Verwendung einer 
Vorrichtung nach Anspruch 1 , 

dadurch gekennzeichnet, 

dass das einem Namen zugeordnete Wortmodell 
(Phonemkette) aus einer Datenbank, in welcher Ei- 
gennamen entsprechenden Phoneme bzw- Pho- 
nemketten hinterlegt sind, ermittelt wird. 

5. Verfahren nach Anspruch 4, dadurch gekenn- 
zeichnet, 

daB das berechnete Wortmodell mit dem zugrun- 
deliegenden ASCII-Text oder mit einem diesem zu- 
geordneten Kode in einer weiteren Datenbank, vor- 
zugsweise im Spracherkenner (7), abgelegt wird. 



6. Verfahren nach Anspruch 4 oder 5, dadurch ge- 
kennzeichnet, 

daB die ASCII-Entsprechung desjenigen ausge- 
wahlten Wortmodells, welches die grdfite Oberein- 
stimmung zum eingegebenen Sprachsignal auf- 
weist, auf einem Display (10) dargestellt wird oder 
das Wortmodell als synthetische Sprache mittels ei- 
nes Lautsprechers (4) wiedergegeben wird und ein 
automatischer Verbindungsaufbau mit der Rufnum- 
mer, welche dem ausgewahlten Wortmodell zuge- 
ordnet ist, erst nach Bestatigung des Erkennungs- 
ergebnisses automatisch ausgefuhrt wird. 



1. Device for speaker-independent voice-activated 
name dialling for telecommunications terminals, 
consisting of a memory (6) for phone numbers and 
names containing names as well as, in each case, 
the therewith associated phone number in the form 
of ASCII text; a grapheme-to-phoneme converter 
(8) for generating a digital word model (phoneme 
chain) from an ASCII text (grapheme chain); a pho- 
neme-based speech recognizer (7) for comparing 
a spoken, digitized speech signal with predeter- 
mined digital word models whose ASCII equivalents 
are known and determining of that word model con- 
forming most closely to the speech signal, the mem- 
ory (6) being adapted for the alphanumeric entering 
of user-defined names and associated phone num- 
bers, the grapheme-to-phoneme converter (8) gen- 
erating from the entered name a corresponding dig- 
ital word model which is stored together with the AS- 
CII text or a thereto assigned code such that the 
speech recognizer (7) is able to access same, 
wherein, for automatic voice-activated name dial- 
ling, an acoustically entered name is relayed to the 
speech recognizer (7) in the form of a digital speech 
signal and is compared by the speech recognizer 
(7) with predetermined word models, wherein, for 
that word model conforming most closely to the 
speech signal, the speech recognizer (7) deter- 
mines the corresponding ASCII text or thereto as- 
signed code, this being used to retrieve the associ- 
ated phone number from the memory (6), the 
speech and dialling apparatus (2) of the terminal au- 
tomatically setting up a telecommunications con- 
nection to that phone number, 
characterized in that 

grapheme-to-phoneme conversion is supported by 
an exceptions dictionary containing sequences cor- 
responding to phonetic peculiarities of proper 
names, said sequences being inserted into the pho- 
neme chain by the grapheme-to-phoneme convert- 
er (8). 

2. Device according to claim I, characterized in that 
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grapheme-to-phoneme conversion is supported by 
an onomastics database containing proper names 
in the form of ASCII text as well as in the form of 
digital word models. 

5 

3. Device according to claim 1 or 2, characterized in 
that 

that digital word model found by the speech recog- 
nizer (7) to conform most closely to a name entered 
in the form of a speech signal is acoustically repro- 10 
duced by means of a speech synthesizer (11) be- 
fore automatic connection setup is initiated, auto- 
matic connection setup to the phone number asso- 
ciated with the recognized name not being execut- 
ed until after confirmation of the result of recogni- 15 
tion. 

4. Process for setting up a personal phone number di- 
rectory for speaker-independent voice-activated 
name dialling for telecommunications terminals, 20 
with alphanumeric entering of one or more names 
and associated phone numbers, storage of the en- 
tered data in ASCII format, calculation of a digital 
word model of the name(s) on the basis of the cor- 
responding ASCII text by grapheme-to-phoneme 25 
conversion, storage of the word model such that as- 
sociation with the underlying ASCII text is possible, 
using a device according to claim 1, 
characterized in that 

the word model (phoneme chain) associated with a 30 
name is determined from a database containing 
phonemes / phoneme chains corresponding to 
proper names. 

5. Process according to claim 4, characterized in 35 
that 

the calculated word model is stored with the under- 
lying ASCII text or with a thereto assigned code in 
a further database, preferably in the speech recog- 
nizer (7). 40 

6. Process according to claim 4 or 5, characterized 
in that 

the ASCII equivalent of that selected word model 
conforming most closely to the entered speech sig- 45 
nal is displayed on a display (10) or the word model 
is reproduced in the form of synthetic speech by 
means of a loudspeaker (4) and an automatic con- 
nection setup is automatically executed to the 
phone number associated with the selected word so 
model, but not until after confirmation of the result 
of recognition. 



Revendications 55 

1. Dispositif de selection de noms destine aux termi- 
naux de telecommunication, fonctionnant indepen- 
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damment de la personne qui les prononce et com- 
portant une memoire (6) des numeros d'appel et 
des noms, dans laquelle les noms, et les numeros 
d'appels qui y sont associes, sont enregistres sous 
la forme d'un texte ASCII, un convertisseur graphe- 
me-phoneme (8) permettant de generer un modele 
de mot numerique (chame de phonemes) a partir 
d'un texte ASCII (chaine de graphemes), un syste- 
me de reconnaissance vocale (7) a base phoneme 
permettant de comparer un signal vocal parte et nu- 
m6rise avec un modele de mot numerique prede- 
termine dont la correspondance ASCII est connue 
et de definir le modele de mot qui presente la plus 
grande similarity avec le signal vocal, la memoire 
(6) pouvant etre remplie par les donnees alphanu- 
meriques des noms definis par I'utilisateur et les nu- 
meros d'appel correspondants, et le convertisseur 
grapheme-phoneme (8) generant un modele de 
mot numerique correspondant au nom introduit, qui 
peut etre memorise avec le texte ASCII ou un code 
lui etant assigne, de telle sorte que le systeme de 
reconnaissance vocale (7) peut y acceder, conside- 
rant que, pour selection ner un nom automatique- 
ment, un nom entre de maniere acoustique est 
transmis au systeme de reconnaissance vocale (7) 
sous la forme d'un signal vocal numerique et com- 
pare par le systeme de reconnaissance vocale a 
des modeles de mots predetermines, et que le sys- 
teme de reconnaissance vocale (7) assigne au mo- 
dele de mot qui presente la plus grande similitude 
avec le signal vocal le texte ASCII ou le code cor- 
respondant qui sert a appeler le numero d'appel as- 
socie dans la memoire (6), le dispositif d'appel et le 
dispositif de numerotation (2) du terminal etablis- 
sant alors automatiquement la communication avec 
ce numero d'appel, 
Caracterise par en ce que 

la conversion grapheme-phoneme est assistee par 
un dictionnaire d'exceptions dans lequel sont stoc- 
kees les sequences correspondantes aux caracte- 
ristiques phonetiques des noms propres, qui sont 
inserees par le convertisseur grapheme-phoneme 
(8) dans la chame de phonemes. 

2. Dispositif selon la revendication 1 caracterise en 
ce que 

la conversion grapheme-phoneme est assistee par 
une banque de donnees onomastique dans laquelle 
les noms propres sont enregistres sous forme d'un 
texte ASCII et d'un modele de mot numerique. 

3. Dispositif selon la revendication 1 ou 2, caracterise 
en ce que 

le modele de mot numerique, pour lequel le syste- 
me de reconnaissance vocale (7) constate la plus 
grande similitude avec un nom entre comme signal 
vocal, est restitue de maniere acoustique au moyen 
d'un synthetiseur de parole (11) avant que I'etablis- 
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sement automatique de fa communication soit ini- 
tialise, la communication n'etant definitivement eta- 
blie avec le numero correspondant au nom identifie 
qu'apres confirmation du resultat de la reconnais- 
sance. 5 



4. Procede destine aux terminaux de Deutsche Te- 
lekom, permettant d'etablir un annuaire personnel 
des numeros d'appel pour selectionner les nom dic- 

tes independamment de la personne qui les pro- 10 
nonce, avec entree alphanumerique d'un ou p!u- 
sieurs noms et des numeros d'appel qui y sont as- 
socies, memorisation des donnees introduites sous 
format ASCII, calcul d'un modele de mot numerique 
du ou des noms sur la base du texte ASCII corres- 15 
pondant par la conversion grapheme-phoneme du 
modele de mot, de maniere a ce que I'assignation 
avec le texte ASCII qui en constitue Porigine soit 
possible, et utilisant un dispositif selon la revendi- 
cation 1 , 20 
caracterise en ce que 

un modele de mot (chaine de phonemes) attribu6 
a un nom est determine a partir d'une banque de 
donnees dans laquelle sont enregistres des phone- 
mes ou des chaines de phonemes correspondant 25 
aux noms propres. 

5. Procede selon la revendication 4 caracterise en ce 
que 

le modele de mot calcule est enregistre avec le tex- 30 
te ASCII qui en constitue Torigine ou avec un code 
qui lui a ete assigne dans une autre banque de don- 
nees, de preference dans le systeme de reconnais- 
sance vocale (7). 

35 

6. Procede selon la revendication 4 ou 5 caracterise 
en ce que 

la correspondance ASCII du modele de mot selec- 
tionne qui presente la plus grande similitude avec 
le signal vocal introduit est represente sur un ecran 40 
(10) ou que le modele de mot est restitue sous la 
forme d'un langage synthetique par le biais d'un 
haut-parleur (4) et qu'un etablissement automati- 
que de la communication avec le numero d'appel 
assigne au modele de mot selectionne, n'est exe- 45 
cute automatiquement qu'apres confirmation du re- 
sultat de la reconnaissance. 
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